約 6,677,584 件
https://w.atwiki.jp/mhta/
管理者信息/管理者情報/Manager Information 这是由MH_TheOne个人统计的非官方怪物猎人竞速TA统计表wiki。 このwikiはかみむ ライト個人提供するの非公式モンスターハンターTAwikiです。 This is unofficial Monster Hunter speedrun TA statistics table for my personal statistics wiki, by MH_TheOne. 目的是为了个人查阅以及学习,不具有官方效力。 目的は个人の査阅と学习のためです。公式効力を代表することはない。 The purpose of built this website is for personal reference and learning. It does not have official effect. 收录版本/収録バージョン/Version MHXX(MHGU)TA rule MH4G(MH4U)TA rule MHP3(MHP3HD)TA rule MHP2G(MHFU)TA rule 具体的规则请见详情页面。 具体的なルールは詳細ページを参照してください。 Please refer to the details page for specific rules. 目的/Purpose (按照重要度进行排序): 1.是为了满足个人对这款游戏的热爱,以及个人兴趣。方便个人查阅和学习不同的成绩。 2.在与同伴进行交流和讨论的过程中可以更加的方便。 3.在怪物猎人以前的TA网站停止更新以后,提供给想要继续参与竞速的玩家一个可以进行登记和参考网页页面。 (重要度でソート): 1.このゲームに対する自分自身な愛と、自分自身な興味を満たすためです。自分で調べたり勉強したりするのに便利です。 2.仲間とのコミュニケーションやディスカッションの過程で、より便利になることができます。 3.モンスターハンター以前のTAサイトの更新が停止した後も、タイムアタックに参加し続けたいプレイヤーに参照や登録できるページを提供します。 (sorted by importance) 1. It is to satisfy my personal love and interest in this game. Convenient for individuals to access and learn different records. 2. It can provide convenient for communicating and discussing with peers. 3. After the previous TA website of Monster Hunter stopped updating, provide players who want to continue participating in speedrun with a reference and registration webpage page. 管理者联系方式/管理者連絡先/Contact Information 本网页会慢慢的收录目所能及的,以前所有的TA记录。因为这是一个非常浩大的工程量,所以如果完成的很慢,请不要催促。 如果您希望删除或添加您的记录,请私信联系我(*但不代表一定会被同意): Blibili このページには、以前のすべてのTAレコードがゆっくりと収録されています。これは非常に膨大な工事量なので、完成が遅い場合は催促しないでください。 レコードを削除または追加するには、DMで次のように連絡してください(*でも必ず同意するとは限らない): This webpage will gradually include all previous TA records within the reach of the directory. Because this is a very large project quantity, please do not rush if the completion is slow. If you wish to delete or add your records, please contact me privately(*But it doesn't mean I will definitely agree) Twitter 声明/ステートメント/Statement ※本wiki是非官方的wiki。不保证信息的妥当性和准确性,不承担任何责任。 ※使用本wiki所产生的任何损失本网站都不补偿。 ※关于如何使用本网站提供的数据是自己的责任,请注意。 ※另外,该wiki及wiki管理员与株式会社卡普空完全没有关系。 ※私は日本人ではないので、日本語の翻訳は少し間違っているかもしれませんが、ツイッターに来て教えてください。 ※当wikiは非公式のwikiです。情報の妥当性や正確性について保証するものではなく、一切の責任を負いかねます。 ※当wikiを利用することによって生じるいかなる損害も当サイトでは補償致しません。 ※ご利用につきましては自己責任となりますのでご注意ください。 ※また、当wikiおよびwiki管理人は株式会社カプコンとは一切関係がありません。 ※Because I am not a native English speaker, there may be some slight errors in English translation. Welcome to Twitter to let me know. ※This wiki is unofficial. We do not guarantee the appropriateness and accuracy of the information and assume no responsibility. ※Any losses incurred by using this wiki will not be compensated by this website. ※Please note that the use is your own responsibility. ※In addition, the wiki and its administrator have no relationship with CAPCOM™.
https://w.atwiki.jp/xbox360score/pages/1055.html
Transformers War for Cybertron 項目数: 総ポイント:1000 難易度: A Prime Problem Complete Defend Iacon on any difficulty.任意の難易度でチャプター「Defend Iacon」をクリアする 10 The Last Prime Complete Kaon Prison Break on any difficulty.任意の難易度でチャプター「Kaon Prison Break」をクリアする 10 You Got the Touch Complete To the Core on any difficulty.任意の難易度でチャプター「To the Core」をクリアする 10 The War Within Complete Aerial Assault on any difficulty.任意の難易度でチャプター「Aerial Assault」をクリアする 10 The Harder They Fall Complete One Shall Stand on any difficulty.任意の難易度でチャプター「One Shall Stand」をクリアする 10 Paging Ratchet Revive 5 Autobot soldiers in Defend Iacon.チャプター「Defend Iacon」で5体のオートボットの戦士を復活させる 15 Beak Breaker Shoot the 3 Hidden Laserbeaks throughout Kaon Prison Break.チャプター「Kaon Prison Break」で隠れている3体のコンドルを狙撃する 15 Slugfest Save the Slug before it is executed in To the Core.チャプター「To The Core」でSlugを処刑される前に救出する 15 Powerglide Performer Fly through the coolant tunnels in 23 seconds in Aerial Assault.チャプター「Aerial Assault」でcoolant tunnelsを23秒以内に通過する 15 First We Crack the Shell... Get smashed by Trypticon s hand as he falls into the energon goo in One Shall Stand.チャプター「One Shall Stand」で落下するダイナザウラーの最後の一撃を喰らう 15 Autobot Recruit Autobot Campaign Complete (Easy).難易度イージーでオートボットキャンペーンをクリアする 15 Autobot Commander Autobot Campaign Complete (Medium).難易度ミディアムでオートボットキャンペーンをクリアする 30 Autobot Prime Autobot Campaign Complete (Hard).難易度ハードでオートボットキャンペーンをクリアする 45 Dark Awakening Complete Dark Energon on any difficulty.任意の難易度でチャプター「Dark Energon」をクリアする 10 Starscream s Brigade Complete Fuel of War on any difficulty.任意の難易度でチャプター「Fuel of War」をクリアする 10 The Fall of Iacon Complete Iacon Destroyed on any difficulty.任意の難易度でチャプター「Iacon Destroyed」をクリアする 10 The Secret of Omega Supreme Complete Death of Hope on any difficulty.任意の難易度でチャプター「Death of Hope」をクリアする 10 Victory is Mine Complete The Final Guardian on any difficulty.任意の難易度でチャプター「The Final Guardian」をクリアする 10 Your Lucky Day Kill all but 1 of the neutral prisoners in Dark Energon.チャプター「Dark Energon」で囚人を1人残して皆殺しにする 15 Thief in the Night Find and disable all security trip-wire switches in Fuel of War.チャプター「Fuel of War」でセキュリティ用トラップのスイッチを全て探し出し破壊する 15 Chaos Bringer Destroy the planets in the Stellar Galleries in Iacon Destroyed.チャプター「Iacon Destroyed」でStellar Galleriesの惑星模型を全て破壊する 15 Motormaster! Race across the Chasm Bridge in 33 seconds in Death of Hope.チャプター「Death of Hope」でChasm Bridgeを33秒以内で走破する 15 Devastator! Destroy all cover in the arena in The Final Guardian.チャプター「The Final Guardian」で闘技場の壁と柱を全て破壊する 15 Decepticon Grunt Decepticon Campaign Complete (Easy).難易度イージーでディセプコンキャンペーンをクリアする 15 Decepticon Seeker Decepticon Campaign Complete (Medium).難易度ミディアムでディセプコンキャンペーンをクリアする 30 Decepticon Warlord Decepticon Campaign Complete (Hard).難易度ハードでディセプコンキャンペーンをクリアする 45 Till All Are One Complete both Campaigns (Any Difficulty).任意の難易度で両方のキャンペーンをクリアする 30 Brute-a-kiss! Ignite a Brute s back 5 times in Campaign or Escalation. キャンペーンかエスカレーションでBruteのバックパックを5回発火させる 15 Footloose and Fancy Free Destroy a Jet Soldier s foot thruster 5 times in Campaign or Escalation.キャンペーンかエスカレーションでJet Soldieの足のスラスターを5回破壊する 15 That s No Mirage Headshot a Cloaker when it is invisible in Campaign or Escalation.キャンペーンかエスカレーションで透明になっている敵をヘッドショットする 15 Targetmaster! Kill 2 Snipers in 5 seconds in Campaign.キャンペーンで5秒以内に2体のスナイパーを倒す 15 There Are Parts Everywhere Multi-Kill 3 car soldiers at once using an explosive weapon in Campaign or Escalation.キャンペーンかエスカレーションで爆発武器を使ってcar soldierを3体同時に倒す 15 Blast-arachnia! Destroy 100 Spiders in Campaign or Escalation.キャンペーンかエスカレーションで100体のスパイダーを破壊する 15 Fire in the Sky Melee-kill a Jet Vehicle in the air in Campaign or Escalation.キャンペーンかエスカレーションで空中のジェットビークルを殴って倒す 15 Friends to the End Finish any level in Co-Op.任意の難易度でCo-Opをクリアする 15 Unlikely Allies Finish any level in Competitive Co-Op.任意の難易度でCompetitive Co-Opをクリアする 15 More Than Meets the Eye Earn a 1st Place MVP award in any Multiplayer mode.マルチプレイで一位を獲得する 15 You Got Spark, Kid Reach level 5 in any single class in Multiplayer.マルチプレイで任意のひとつのクラスがレベル5になる 5 Spike s BFF Reach level 25 in any single class in Multiplayerマルチプレイで任意のひとつのクラスがレベル25になる 15 The Kup s Half Full Reach a combined class level of 50 in Multiplayer.マルチプレイで全てのクラスの合計レベルを50にする 25 Only the Strong Survive Reach a combined class level of 75 in Multiplayer.マルチプレイで全てのクラスの合計レベルを75にする 50 Top of the Scrap Heap Reach a combined class level of 100 in Multiplayer.マルチプレイで全てのクラスの合計レベルを100にする 75 Prime Directive Unlock Prime Mode.プライムモードを解除する 30 Powermaster! Spend 25,000 Power in Escalation mode.エスカレーションで2,5000パワーを使う 30 Heavy Metal War Complete the 15th wave in Escalation.エスカレーションでウェーブ15をクリアする 50 Scavenger Would Be Proud! Destroy all hidden Autobot symbols in the Decepticon Campaign.ディセプコンキャンペーンで隠されたオートボットのシンボルを全て破壊する 25 Grimlock, Smash! Destroy all hidden Decepticon symbols in the Autobot Campaign.オートボットキャンペーンで隠されたディセプコンのシンボルを全て破壊する 25 Action Master Get 10 kills with a single detached turret in any mode.任意のモードで取り外したタレットで10キルする 15 Wait! I Still Function! Get 3 kills while downed in a Co-Op Campaign or Escalation mode.キャンペーンCOOPかエスカレーションでダウン中に3キルする 30 Ramhorn Ram-kill against an enemy who is stunned by an EMP grenade in Campaign or Multiplayer.キャンペーンかエスカレーションでEMP grenadeでスタンしている敵をロードキルする 15 クリア系実績 上位難易度でのクリアで下位難易度のクリア実績も同時に解除されるため、キャンペーンをハードで1周するだけで 全てのクリア系実績は解除される。難易度ミディアムで1周後、各チャプターの最終ステージのみハードに変更して クリアするだけでもハードクリアの実績は解除される。 累計実績 シングル、マルチ、エスカレーション共通で、「○○を○体倒す」等の実績は、進捗状況が表示される。 Beak Breaker http //www.youtube.com/watch?v=GyR3bk1s_FI Friends to the End チャプターをひとつクリアすれば解除。 COOP部屋を立て、相方がいない状況でゲームを始めステージをクリアしても解除可。 The Final Guardianを難易度easyでやれば数分で終わる。 Unlikely Allies Competitive Scoringをオンにしてチャプターをひとつクリアすれば解除。 COOP部屋を立て、相方がいない状況でゲームを始めステージをクリアしても解除可。 The Final Guardianを難易度easyでやれば数分で終わる。 Paging Ratchet http //www.youtube.com/watch?v=n9S6ILyaibE Wait! I Still Function! Escalationで狙うと簡単。 Your Lucky Day チャプター1 Dark Energonの"Moving Forward"で、光の輪で拘束されているオートボットを、一体残して全部破壊。 http //www.youtube.com/watch?v=7-tvhB-pQYM Thief in the Night 合計5つ。 http //www.youtube.com/watch?v=hdW35STnd7Q Motormaster! 「Death of Hope」のGuardian on the Bridge。 SoundwaveのRBの突進を使わないと間に合わない。 http //www.youtube.com/watch?v=Pmo-Wxdvu58 Devastator! Omega Supremeとの最後の地上戦で、全てのカバーポイントを破壊。 自分では壊せないのでOmega Supremeのミサイル等を誘導して全て壊せば解除。 柱などが欠けるだけで完全に破壊されない場合があるので見落とし注意。 Prime Directive プライムモードとは、マルチでレベルがMAXになった時にレベルを初期化するモードのこと。 Modern WarfareでいうところのPrestige(名誉)モード
https://w.atwiki.jp/kakamama/pages/11.html
工具Pick (ピッケル) Shovel (シャベル) Spade (スペード?) Saw (糸鋸) Iron Pitchfork (ピッチフォーク) Fishing Rod (釣り竿) 道具Matchstick (マッチ棒) Flint Lighter (火打石) Grass Sleeping Pad (草の移動式寝床) Bandage (絆創膏) Repair Kit (修理道具) Energy Linker (電気リンカ) Flashlight (懐中電灯) 他のクラフト補助の道具Vice (万力) Iron Chisel (鉄のたがね) Grassblowing Pipe (吹き棹:ふきさお) Sewing Kit (裁縫セット) Stone Mortar (すり鉢) Screwdriver (マイナスドライバー) 消耗道具Grass Rope (草のロープ) Magnifying Glass (虫眼鏡) Cogwheel (歯車) Steel Plate (鉄板) Copper Wire (銅線) Propeller (プロペラ) Pharaow Scepter (ファラオの笏) Anvil (金床) Furnace Lining (炉裏張り) Casting Mold (鋳型) Blank paper Sheet (白紙) Cloth (布) Leather (革) Yarn (糸) Copper Ingot (銅のインゴット) Iron Ingot (鉄のインゴット) Energy Coil (コイル) Energy Converter (変換器) Glass Flask (フラスコ) Light Bulb (白熱電球) Nails (釘) Wind Turbine Blades (風車の羽) Raw Glass (ガラスの原料) Tesla Coil Parts (テスラコイルのパーツ) Vacuum Tube (真空管) Grass Sphere (ガラスの球体) Bellows (ふいご) Soldering Iron (はんだごて) 便利グッズAnnihilator (破壊機) Paintgun (ペイントガン) Terraformer (テラフォーマー) Propeller Pack (プロペラパック) Creator Cube (クリエイターキューブ) Map(地図) Lantern(ランタン) Protective Barrier Generator (プロテクトバリア発生器) 筆記用具Quill And Ink (インク入れ) pencil (鉛筆) ホルダー系 鍵系 工具 Pick (ピッケル) Stone Pick Iron Pick recipe Iron Ingot × 1Stick × 1Any Hammer × 1 ピッケルの事? ~石類を破壊しようとしても出来ないので、ハンマーで。スペードと採掘量が変わるかは分からない。~ Shovel (シャベル) Wooden sHovel Iron Shovel recipe Iron Ingot × 1Pole × 1Any Hammer × 1 穴を掘るかと思いきや、平たくするのに使う。整地にどうぞ。自分の立つ高さで整地する。 Spade (スペード?) Iron Spade recipe Iron Ingot × 1Pole × 1Any Hammer × 1 -穴を掘る- Saw (糸鋸) Iron Saw recipe Iron Ingot 1× Stick × 1Any Hammer × 1 -木を切り倒す時使用- ~斧と比べともあまり差はないが、周りの物を破壊しない。~ Iron Pitchfork (ピッチフォーク) recipe Iron Ingot × 1Pole × 1Any Hammer × 1 -使い方が分からない- Fishing Rod (釣り竿) recipe Any Rope 1他 道具 分類しにくいここ。 Matchstick (マッチ棒) recipe 使い方よく分からない Flint Lighter (火打石) recipe Flint × 2 火をつけるのに使う。火のついた松明でも代用できる Grass Sleeping Pad (草の移動式寝床) imageプラグインエラー ご指定のファイルが見つかりません。ファイル名を確認して、再度指定してください。 (Grass Sleeping pad.png) [E]を押して左、広げてから使う。 recipe Bandage (絆創膏) ライフが2回復 ライフが4位回復? : : Rags×3もしくはClothで4Bandage。各植物が3つで1薬液=1薬付きBandage。回復量は比ではないが作るのが少し面倒。使用には時間がかかるので、周りに敵がいないときに。 Repair Kit (修理道具) Basic Repair Kit Advance Repair Kit 壊れた武器の画面、その左下のREPAIRを押す。 recipe Energy Linker (電気リンカ) Energy Linker 電気をつなぐ?手に持って使う。 recipe Flashlight (懐中電灯) 充電なしで使える。 recipe 他のクラフト補助の道具 耐久表示のあるやつ Vice (万力) recipe はさんで固定する器具。 Iron Chisel (鉄のたがね) -石材加工で使用。- recipe Iron Ingot × 1Any Hammer × 1 Grassblowing Pipe (吹き棹:ふきさお) ガラス用品作るのに使う。 recipe Iron Ingot × 2 Any Hammer × 1 Sewing Kit (裁縫セット) recipe Yarn × 1 Any Needle × 1 Stone Mortar (すり鉢) Pigmentを作るのに必要 recipe Screwdriver (マイナスドライバー) -懐中電灯を作るときとか- recipe Iron Ingot × 1 Stick × 1 Any Hammer × 1 消耗道具 消耗品。クラフトで消えるやつ。 Grass Rope (草のロープ) recipe Grass × 3 Magnifying Glass (虫眼鏡) recipe Cogwheel (歯車) Steel Plate (鉄板) Copper Wire (銅線) Propeller (プロペラ) FOUNDORYで作られる recipe Pharaow Scepter (ファラオの笏) 利用法が分からない。装飾かもしれない。 Anvil (金床) recipe Iron Ingot × 5 Any Hammer × 1 Furnace Lining (炉裏張り) recipe Kiln Clay × 1 Sand × 1 Casting Mold (鋳型) recipe Iron Ingot × 20Any Hammer × 1 Blank paper Sheet (白紙) imageプラグインエラー ご指定のファイルが見つかりません。ファイル名を確認して、再度指定してください。 (Brank Paper sheet.png) recipe Cloth (布) recipe Leather (革) recipe Yarn (糸) recipe Copper Ingot (銅のインゴット) recipe Iron Ingot (鉄のインゴット) recipe Energy Coil (コイル) recipe Energy Converter (変換器) recipe Glass Flask (フラスコ) recipe Light Bulb (白熱電球) recipe Nails (釘) recipe Wind Turbine Blades (風車の羽) imageプラグインエラー ご指定のファイルが見つかりません。ファイル名を確認して、再度指定してください。 (Wind turbine Blades.png) recipe Raw Glass (ガラスの原料) recipe Tesla Coil Parts (テスラコイルのパーツ) recipe Vacuum Tube (真空管) recipe Grass Sphere (ガラスの球体) 中に電気?クラフトに使う? recipe Bellows (ふいご) recipe Cloth × 3 Sewing Kit Leather × 3 Sewing Kit Soldering Iron (はんだごて) 電気系を作るとき必要? recipe 便利グッズ 消耗はしない? Annihilator (破壊機) |BGCOLOR(#fff) なんでも消し去る。 recipe Paintgun (ペイントガン) -説明文- recipe Terraformer (テラフォーマー) -説明文- recipe Propeller Pack (プロペラパック) imageプラグインエラー ご指定のファイルが見つかりません。ファイル名を確認して、再度指定してください。 (Propeller Pack.png) 空が飛べる。燃料とかはない。 recipe Creator Cube (クリエイターキューブ) クリエイトモード recipe Map(地図) -空白を埋めていこう。筆記用具も必要- recipe 1 Lantern(ランタン) Lantern Ylandium Lantern 消えない光源。 recipe Protective Barrier Generator (プロテクトバリア発生器) Broken Protective Barrier Generator Protective Barrier Generator imageプラグインエラー ご指定のファイルが見つかりません。ファイル名を確認して、再度指定してください。 (Broken protective Barrier Generator.png) imageプラグインエラー ご指定のファイルが見つかりません。ファイル名を確認して、再度指定してください。 (Protective Barrier generator.png) 機器を中心として立方形の青線が発生。効果はバリア内で死んでも持ち物を落とさずにリスポーン?正しいか分かりません。 筆記用具 Quill And Ink (インク入れ) recipe 筆記用具のひとつ pencil (鉛筆) recipe 木炭から作る。 ホルダー系 中に、その系統の物を入れられる。インベントリの節約。 Key (鍵入れ) 鍵を中に入れられる。Blacksmith. Soil (土入れ) imageプラグインエラー ご指定のファイルが見つかりません。ファイル名を確認して、再度指定してください。 (ホルダー系土.png) 石は入らず。 Harb Bag (ハーブ入れ) 序盤の内に Shell (貝殻入れ) あんまり使わない貝殻 Seed (種入れ) 序盤の内に Pigment (染料入れ) Coal (炭入れ) 石炭木炭 Potion (ポーション入れ) 鍵系 Blank Key(空白の鍵:橙) Blank Key(空白の鍵:白) Rusty Key(古い鍵) Goleden Key (黄金の鍵)
https://w.atwiki.jp/youtube-gvideo/pages/14.html
よくある質問 よくある質問をQ A形式でまとめました。 ここに無い場合は掲示板で質問してみてください。 Q.YouTube、Google Videoって何? |A.動画共有サイトです。詳しくはこちら。 Q.無料なの? |A.YouTubeは無料、Google Videoは一部有料の物もあるが(アメリカ在住者のみ購入可能)他は無料です。 Q.動画は保存可能 |A.はい、動画の保存方法をご覧ください。 Q.日本語版は無い? |A.ありませんが、下のように翻訳サービスを利用すると大体把握できるかと思います。(Google 翻訳を使用) ※youtubeには日本語版のサイトがあります(アカウント等英語版と共通です)。 You Tube 公式日本語版 Google Video 非公式日本語版 Q.(YouTubeの)タグとは一体何? |A.それぞれの動画を分類するためのものです。 Q.YouTubeの読み方は? |A.おそらく「ゆーちゅーぶ」です、が「ようつべ」とか適当に呼んでも多分OK。 Q.YouTube動画を落としたら「get-video」で保存されてしまった |A.「get-video」という名前で保存された場合、拡張子「.flv」を付けて「abc.flv」の様に改名すれば、通常のflvファイルとして使用できます。 Q.「.flv」形式ファイルについて |A.flv形式対応のプレイヤーを使うか(参考)、「携帯動画変換君」(Win)・「携帯動画変換ちゃん」(Mac)などで変換するのがおすすめです。 Q.「Sorry. Based on the information you have submitted to us, you are ineligible to register for YouTube.com. 」というエラーが出てYouTubeに登録出来ない。 |A.IE(インターネットエクスプローラ)を使って登録してみてください。 Q.ここに知りたい質問が無い |A.掲示板で質問してみてください。
https://w.atwiki.jp/vhs-tapes/pages/4.html
テンプレート #ref error :ご指定のファイルが見つかりません。ファイル名を確認して、再度指定してください。 (.jpg) 製造番号 リール金型番号 カセット前面金型番号 カセット後面金型番号 テープ蓋金型番号 後面右欄 品番 発売日 JAN 製造国 グレード 事業者名 備考
https://w.atwiki.jp/styraise/
@wikiへようこそ ウィキはみんなで気軽にホームページ編集できるツールです。 このページは自由に編集することができます。 メールで送られてきたパスワードを用いてログインすることで、各種変更(サイト名、トップページ、メンバー管理、サイドページ、デザイン、ページ管理、等)することができます まずはこちらをご覧ください。 @wikiの基本操作 用途別のオススメ機能紹介 @wikiの設定/管理 分からないことは? @wiki ご利用ガイド よくある質問 無料で会員登録できるSNS内の@wiki助け合いコミュニティ @wiki更新情報 @wikiへのお問合せフォーム 等をご活用ください @wiki助け合いコミュニティの掲示板スレッド一覧 #atfb_bbs_list その他お勧めサービスについて 大容量1G、PHP/CGI、MySQL、FTPが使える無料ホームページは@PAGES 無料ブログ作成は@WORDをご利用ください 2ch型の無料掲示板は@chsをご利用ください フォーラム型の無料掲示板は@bbをご利用ください お絵かき掲示板は@paintをご利用ください その他の無料掲示板は@bbsをご利用ください 無料ソーシャルプロフィールサービス @flabo(アットフラボ) おすすめ機能 気になるニュースをチェック 関連するブログ一覧を表示 その他にもいろいろな機能満載!! @wikiプラグイン @wiki便利ツール @wiki構文 @wikiプラグイン一覧 まとめサイト作成支援ツール バグ・不具合を見つけたら? 要望がある場合は? お手数ですが、メールでお問い合わせください。
https://w.atwiki.jp/asterisk99/pages/579.html
original (2019/05/14 付) Google 翻訳 (2019/05/28 付) ------------------------------------ ------------------------------------ ### For training Neural net based LSTM Tesseract 4.00 see Training Tesseract 4.00 ###ニューラルネットベースのLSTM Tesseract 4.00をトレーニングするにはTraining Tesseract 4.00を参照してください。 ------------------------------------- ------------------------------------- ### How to use the tools provided to train Tesseract 3.00–3.02 for a new language? ###新しい言語のためにTesseract 3.00–3.02を訓練するために提供されたツールをどのように使いますか? NOTE These instructions are for older versions of Tesseract. Training instructions for the more recent versions are [[here Training-Tesseract]]. 注 これらの説明は古いバージョンのTesseract用です。より新しいバージョンのためのトレーニング指示は[[here Training-Tesseract]]です。 * Introduction * はじめに * Background and Limitations * 背景と制限 * Data files required * 必要なデータファイル * Requirements for text input files * テキスト入力ファイルの要件 * How little can you get away with? * あなたはどのくらい逃げることができますか? * Training Procedure * トレーニング手順 * Generate Training Images * トレーニング画像の生成 * Make Box Files * ボックスファイルの作成 * Bootstrapping a new character set * 新しい文字セットのブートストラップ * Tif/Box pairs provided! * Tif / Boxペアが提供されました! * Run Tesseract for Training * トレーニングのためにTesseractを実行する * Compute the Character Set * 文字セットを計算する * font_properties (new in 3.01) * font_properties(3.01の新機能) * Clustering * クラスタリング * shapeclustering (new in 3.02) * shapeclustering(3.02の新機能) * mftraining * mftraining * cntraining * cntraining * Dictionary Data (Optional) * [辞書データ(任意)](#辞書データ - 任意) * The last file (unicharambigs) * 最後のファイル(unicharambigs) * Putting it all together * 全部まとめて # Introduction # 前書き Tesseract 3.0x is fully trainable. This page describes the training process, provides some guidelines on applicability to various languages, and what to expect from the results. Tesseract 3.0xは完全にトレーニング可能です。このページでは、トレーニングプロセスについて説明し、さまざまな言語への適用性に関するガイドライン、および結果から何を期待するかについて説明します。 3rd Party training tools are also available for training. サードパーティのトレーニングツールもトレーニングに利用できます。 Please check the list of languages for which traineddata is already available as of release 3.04 before embarking on training. トレーニングを開始する前に、traineddataがリリース3.04以降ですでに使用可能である言語のリストを確認してください。 # Background and Limitations #背景と制限 Tesseract was originally designed to recognize English text only. Efforts have been made to modify the engine and its training system to make them able to deal with other languages and UTF-8 characters. Tesseract 3.0 can handle any Unicode characters (coded with UTF-8), but there are limits as to the range of languages that it will be successful with, so please take this section into account before building up your hopes that it will work well on your particular language! Tesseractはもともと英語のテキストだけを認識するように設計されました。エンジンとそのトレーニングシステムを変更して、他の言語とUTF-8文字を処理できるようにする努力がなされています。 Tesseract 3.0は(UTF-8でコード化された)どんなユニコード文字も扱うことができますが、それがうまくいく言語の範囲に関して制限があるので、それがうまくいくことを期待する前にこのセクションを考慮に入れてくださいあなたの特定の言語! Tesseract 3.01 added top-to-bottom languages, and Tesseract 3.02 added Hebrew (right-to-left). Tesseract currently handles scripts like Arabic and Hindi with an auxiliary engine called cube (included in Tesseract 3.0+). Traineddata for additional [languages] (https //github.com/tesseract-ocr/tesseract/blob/master/doc/tesseract.1.asc#languages) has been provided by Google for the 3.04 release. Tesseract 3.01では上から下への言語が追加され、Tesseract 3.02ではヘブライ語(右から左へ)が追加されました。 Tesseractは現在、cubeと呼ばれる補助エンジン(Tesseract 3.0以降に含まれています)を使ってアラビア語やヒンディー語などのスクリプトを処理します。追加の[言語]のトレーニングデータ(https //github.com/tesseract-ocr/tesseract/blob/master/doc/tesseract.1.asc#languages)が3.04リリース用にGoogleから提供されています。 Tesseract is slower with large character set languages (like Chinese), but it seems to work OK. Tesseractは(中国語のような)大きな文字セット言語では遅くなりますが、うまくいくようです。 Tesseract needs to know about different shapes of the same character by having different fonts separated explicitly. The number of fonts is limited to 64 fonts. Note that runtime is heavily dependent on the number of fonts provided, and training more than 32 will result in a significant slow-down. Tesseractは、異なるフォントを明示的に分離することによって、同じ文字の異なる形状について知る必要があります。フォント数は64フォントに制限されています。実行時間は提供されるフォントの数に大きく依存します。32以上のトレーニングは大幅に遅くなります。 For versions 3.00/3.01, any language that has different punctuation and numbers is going to be disadvantaged by some of the hard-coded algorithms that assume ASCII punctuation and digits. [Fixed in 3.02] バージョン3.00 / 3.01では、異なる句読点と数字を持つ言語は、ASCII句読点と数字を想定したハードコードされたアルゴリズムによって不利になるでしょう。 [3.02で修正] You need to run all commands in the same folder where your input files are located. 入力ファイルが置かれているのと同じフォルダーですべてのコマンドを実行する必要があります。 # Data files required #必要なデータファイル To train for another language, you have to create some data files in the tessdata subdirectory, and then crunch these together into a single file, using combine_tessdata. The naming convention is languagecode.file_name Language codes for released files follow the ISO 639-3 standard, but any string can be used. The files used for English (3.00) are 別の言語を訓練するには、いくつかのデータファイルを tessdataサブディレクトリに作成してから、それらをcombine_tessdataを使用して1つのファイルにまとめる必要があります。命名規則は languagecode.file_nameですリリースされたファイルの言語コードはISO 639-3規格に従いますが、どんな文字列でも使用できます。英語(3.00)に使用されるファイルは次のとおりです。 * tessdata/eng.config * tessdata / eng.config * tessdata/eng.unicharset * tessdata / eng.unicharset * tessdata/eng.unicharambigs * tessdata / eng.unicharambigs * tessdata/eng.inttemp * tessdata / eng.inttemp * tessdata/eng.pffmtable * tessdata / eng.pffmtable * tessdata/eng.normproto * tessdata / eng.normproto * tessdata/eng.punc-dawg * tessdata / eng.punc-dawg * tessdata/eng.word-dawg * tessdata / eng.word-dawg * tessdata/eng.number-dawg * tessdata / eng.number-dawg * tessdata/eng.freq-dawg * tessdata / eng.freq-dawg ... and the final crunched file is ...そして最後のクランチファイルは次のとおりです。 * tessdata/eng.traineddata * tessdata / eng.traineddata and そして * tessdata/eng.user-words * tessdata / eng.user-words may still be provided separately. まだ別に提供されるかもしれません。 The traineddata file is simply a concatenation of the input files, with a table of contents that contains the offsets of the known file types. See ccutil/tessdatamanager.h in the source code for a list of the currently accepted filenames. NOTE the files in the traineddata file are different from the list used prior to 3.00, and will most likely change, possibly dramatically in future revisions. 訓練されたデータファイルは単に既知のファイルタイプのオフセットを含む目次を持つ入力ファイルの連結です。現在受け入れられているファイル名のリストについては、ソースコードのccutil / tessdatamanager.hを参照してください。 NOTE traineddataファイルのファイルは3.00以前に使用されていたリストとは異なり、おそらく将来の改訂で劇的に変わるでしょう。 ## Requirements for text input files ##テキスト入力ファイルの要件 Text input files (lang.config, lang.unicharambigs, font_properties, box files, wordlists for dictionaries...) need to meet these criteria テキスト入力ファイル(lang.config、lang.unicharambigs、font \ _properties、ボックスファイル、辞書の単語リスト...)は、次の基準を満たす必要があります。 * ASCII or UTF-8 encoding without BOM * [BOM]なしのASCIIまたはUTF-8エンコーディング(http //ja.wikipedia.org/wiki/Byte_order_mark) * Unix end-of-line marker ( \n ) * Unix 行末マーカー( \ n ) * The last character must be an end of line marker ( \n ). Some text editors will show this as an empty line at the end of file. If you omit this you will get an error message containing "last_char == \n Error Assert failed..." *最後の文字は行末マーカー( \ n )でなければなりません。テキストエディタの中にはこれをファイルの最後に空行として表示するものがあります。これを省略すると、 "last \ _char == \ n エラー アサートに失敗しました..."を含むエラーメッセージが表示されます。 ## How little can you get away with? ##あなたはどのくらい逃げることができますか? You must create unicharset, inttemp, normproto, pffmtable using the procedure described below. If you are only trying to recognize a limited range of fonts (like a single font for instance), then a single training page might be enough. The other files no longer need to be provided, but will most likely improve accuracy, depending on your application. あなたは以下で説明される手順を使って unicharset、inttemp、 normproto、pffmtableを作成しなければなりません。限られた範囲のフォント(たとえば単一のフォントなど)のみを認識しようとしている場合は、単一のトレーニングページで十分かもしれません。他のファイルを提供する必要はなくなりましたが、アプリケーションによっては正確性が向上する可能性があります。 # Training Procedure #トレーニング手順 Some of the procedure is inevitably manual. As much automated help as possible is provided. The tools referenced below are all built in the training subdirectory. 手順のいくつかは必然的に手動です。できるだけ多くの自動ヘルプが提供されています。下記のツールはすべてtrainingサブディレクトリに構築されています。 ## Generate Training Images ##トレーニング画像を生成する The first step is to determine the full character set to be used, and prepare a text or word processor file containing a set of examples. The most important points to bear in mind when creating a training file are 最初のステップは、使用する全文字セットを決定し、一連の例を含むテキストまたはワードプロセッサファイルを準備することです。トレーニングファイルを作成する際に留意する必要がある最も重要な点は次のとおりです。 * Make sure there are a minimum number of samples of each character. 10 is good, but 5 is OK for rare characters. *各文字のサンプル数が最小であることを確認してください。 10が良いですが、5はまれな文字のためにOKです。 * There should be more samples of the more frequent characters - at least 20. *より頻繁な文字のサンプルがもっとあるはずです - 少なくとも20。 * Don t make the mistake of grouping all the non-letters together. Make the text more realistic. For example, The quick brown fox jumps over the lazy dog. 0123456789 !@#$%^ (),.{} /? is terrible. Much better is The (quick) brown {fox} jumps! over the $3,456.78 lazy #90 dog duck/goose, as 12.5% of E-mail from aspammer@website.com is spam? This gives the textline finding code a much better chance of getting sensible baseline metrics for the special characters. *すべての非文字を一緒にグループ化するのを間違えないでください。テキストをよりリアルにします。例えば、速い茶色のキツネは怠惰な犬を飛び越えます。 0123456789!@#$%^&()、。{}<> /?はひどいです。はるかに良いです (速い)茶色の{fox}はジャンプします! $ 3,456.78以上の lazy> aspammer@website.comからの電子メールの12.5%がスパムであるため、#90犬&アヒル/ガチョウ?**これにより、テキスト検索コードで特殊文字の適切なベースラインメトリックを取得できる可能性が大幅に高まります。 * [Only relevant to version 3.00, fixed in 3.01] It is sometimes important to space out the text a bit when printing, so up the inter-character and inter-line spacing in your word processor. Not spacing text out sufficiently will cause "FAILURE! box overlaps no blobs or blobs in multiple rows" errors during tr file generation, which leads to FATALITY - 0 labelled samples of "x", which leads to "Error X classes in inttemp while unicharset contains Y unichars" and you can t use your nice new data files. * [バージョン3.00にのみ関連し、3.01で修正されました]印刷するときにテキストを少し離すことが重要な場合がありますので、ワープロの文字間隔と行間を空けてください。テキストの間隔を十分に空けないと、trファイルの生成時に "FAILURE!boxが複数行のblobやblobと重ならない"エラーが発生し、FATALITY - 0のラベル付きサンプル "x"が表示されます。 unicharsetはYのunicharsを含んでいます "そしてあなたはあなたの素晴らしい新しいデータファイルを使うことができません。 * The training data should be grouped by font. Ideally, all samples of a single font should go in a single tiff file, but this may be multi-page tiff (if you have libtiff or leptonica installed), so the total training data in a single font may be many pages and many 10s of thousands of characters, allowing training for large-character-set languages. *トレーニングデータはフォントごとにまとめてください。理想的には、単一のフォントのすべてのサンプルは単一のTIFFファイルに入れるべきですが、これは複数ページのTIFF(libtiffまたはleptonicaがインストールされている場合)なので、単一フォントの合計トレーニングデータは多数のページと数10になります大規模な文字セットの言語のトレーニングが可能 * There is no need to train with multiple sizes. 10 point will do. (An exception to this is very small text. If you want to recognize text with an x-height smaller than about 15 pixels, you should either train it specifically or scale your images before trying to recognize them.) *複数のサイズで訓練する必要はありません。 10点になります。 (これに対する例外は非常に小さいテキストです。もしあなたが約15ピクセルよりも小さいxの高さを持つテキストを認識したいのなら、それらを認識することを試みる前にあなたはそれを特に訓練するかあなたの画像を拡大縮小 * DO NOT MIX FONTS IN AN IMAGE FILE (In a single .tr file to be precise.) This will cause features to be dropped at clustering, which leads to recognition errors. * 画像ファイルにフォントを混ぜない(正確に言えば単一の.trファイルに)これはクラスタリングの際に特徴が落とされて認識エラーを引き起こす原因となります。 * The example boxtiff files on the downloads page will help if you are not sure how to format your training data. *ダウンロードページのboxtiffファイルの例は、トレーニングデータのフォーマット方法がわからない場合に役立ちます。 Next print and scan (or use some electronic rendering method) to create an image of your training page. Up to 64 training files can be used (of multiple pages). It is best to create a mix of fonts and styles (but in separate files), including italic and bold. 次に印刷してスキャンし(または何らかの電子レンダリング方法を使用して)、トレーニングページの画像を作成します。最大64個のトレーニングファイル(複数ページ)を使用できます。イタリック体とボールド体を含め、フォントとスタイルを組み合わせて(ただし別々のファイルに)作成するのが最善です。 NOTE [Only relevant to version 3.00, fixed in 3.01] Training from real images is actually quite hard, due to the spacing-out requirements. It is much easier if you can print/scan your own training text. NOTE [バージョン3.00にのみ関連し、3.01で修正されました]実際の画像からのトレーニングは、間隔を空ける必要があるため、実際にはかなり困難です。あなたがあなた自身のトレーニングテキストを印刷/スキャンすることができればそれははるかに簡単です。 You will also need to save your training text as a UTF-8 text file for use in the next step where you have to insert the codes into another file. 次のステップでコードを別のファイルに挿入する必要がある場合は、トレーニングテキストをUTF-8テキストファイルとして保存する必要もあります。 Clarification for large amounts of training data 大量のトレーニングデータの説明 The 64 images limit is for the number of FONTS. Each font should be put in a single multi-page tiff and the box file can be modified to specify the page number for each character after the coordinates. Thus an arbitrarily large amount of training data may be created for any given font, allowing training for large character-set languages. An alternative to multi-page tiffs is to create many single-page tiffs for a single font, and then you must cat together the tr files for each font into several single-font tr files. In any case, the input tr files to mftraining must each contain a single font. 64イメージの制限はフォントの数です。各フォントは1つのマルチページTIFFに入れられ、ボックスファイルは座標の後の各文字のページ番号を指定するように変更することができます。したがって、任意のフォントに対して任意の量のトレーニングデータを作成でき、大きな文字セット言語のトレーニングが可能になります。複数ページのTIFFに代わる方法は、単一のフォントに対して複数の単一ページのTIFFを作成することです。その後、各フォントのtrファイルをいくつかの単一フォントのtrファイルにまとめる必要があります。いずれにせよ、mftrainingへの入力trファイルはそれぞれ単一のフォントを含まなければなりません。 ## Make Box Files ##ボックスファイルを作る For the next step below, Tesseract needs a box file to go with each training image. The box file is a text file that lists the characters in the training image, in order, one per line, with the coordinates of the bounding box around the image. Tesseract 3.0 has a mode in which it will output a text file of the required format, but if the character set is different to its current training, it will naturally have the text incorrect. So the key process here is to manually edit the file to put the correct characters in it. 以下の次のステップでは、Tesseractは各トレーニング画像を処理するための「ボックス」ファイルを必要とします。ボックスファイルは、トレーニング画像内の文字を1行に1つずつ順番に、画像の周囲の境界ボックスの座標とともにリストしたテキストファイルです。 Tesseract 3.0には、必要な形式のテキストファイルを出力するモードがありますが、文字セットが現在のトレーニングと異なる場合、当然テキストが正しくありません。そのため、ここで重要なプロセスは、ファイルを手動で編集して正しい文字を入れることです。 Run Tesseract on each of your training images using this command line このコマンドラインを使用して、各トレーニング画像に対してTesseractを実行します。 ` | ` tesseract [lang].[fontname].exp[num].tif [lang].[fontname].exp[num] batch.nochop makebox tesseract [言語]。[フォント名] .exp [数値] .tif [言語]。[フォント名] .exp [数値] batch.nochop makebox ` | ` e.g. 例えば ` | ` tesseract eng.timesitalic.exp0.tif eng.timesitalic.exp0 batch.nochop makebox tesseract eng.timesitalic.exp0.tif eng.timesitalic.exp0 batch.nochop makebox ` | ` Now the hard part. You have to edit the file [lang].[fontname].exp[num].box and put the UTF-8 codes for each character in the file at the start of each line, in place of the incorrect character put there by Tesseract. Example The distribution includes an image eurotext.tif. Running the above command produces a text file that includes the following lines (lines 141-154) 今難しい部分です。あなたはファイル [lang]。[fontname] .exp [num] .boxを編集し、そこに置かれた誤った文字の代わりに各行の始めにファイルの各文字のためのUTF-8コードを置かなければなりませんTesseractによって。例 配布には画像eurotext.tifが含まれています。上記のコマンドを実行すると、次の行を含むテキストファイルが生成されます(行141-154)。 ` | ` s 734 494 751 519 0 s 734 494 751 519 0 p 753 486 776 518 0 p 753 486 776 518 0 r 779 494 796 518 0 r 779 494 796 518 0 i 799 494 810 527 0 i 799 494 810 527 0 n 814 494 837 518 0 n 814 494 837 518 0 g 839 485 862 518 0 g 839 485 862 518 0 t 865 492 878 521 0 t 865 492 878 521 0 u 101 453 122 484 0 u 101 453 122 484 0 b 126 453 146 486 0 b 126 453 146 486 0 e 149 452 168 477 0 e 149 452 168 477 0 r 172 453 187 476 0 r 172 453 187 476 0 d 211 451 232 484 0 d 211 451 232 484 0 e 236 451 255 475 0 e 236 451 255 475 0 n 259 452 281 475 0 n 259 452 281 475 0 ` | ` Since Tesseract was run in English mode, it does not correctly recognize the umlaut. This character needs to be corrected using an editor that supports UTF-8. In this case the u needs to be changed to ü. Tesseractは英語モードで実行されたので、ウムラウトを正しく認識しません。この文字は、UTF-8をサポートするエディタを使用して修正する必要があります。この場合、 uはüに変更する必要があります。 Recommended editors that support UTF-8 Notepad++, gedit, KWrite, Geany, Vim, Emacs, Atom, TextMate, Sublime Text. Choose one! Linux and Windows both have a character map that can be used for copying characters that cannot be typed. UTF-8をサポートする推奨エディタ Notepad ++、gedit、KWrite、Geany、Vim、Emacs、Atom、TextMate、Sublime Text。選択してくださいLinuxとWindowsの両方に、入力できない文字をコピーするために使用できる文字マップがあります。 In theory, each line in the box file should represent one of the characters from your training file, but if you have a horizontally broken character, such as the lower double quote „ it will probably have 2 boxes that need to be merged! 理論的には、ボックスファイルの各行はトレーニングファイルの文字の1つを表す必要がありますが、下二重引用符のように水平方向に分割された文字がある場合は、結合する必要があるボックスが2つあります。 Example lines 116-129 例 116〜129行目 ` | ` D 101 504 131 535 0 D 101 504 131 535 0 e 135 502 154 528 0 e 135 502 154 528 0 r 158 503 173 526 0 r 158 503 173 526 0 , 197 498 206 510 0 、197 498 206 510 0 , 206 497 214 509 0 、206 497 214 509 0 s 220 501 236 526 0 s 220 501 501 236 526 0 c 239 501 258 525 0 c 239 501 258 525 0 h 262 502 284 534 0 h 262 502 284 534 0 n 288 501 310 525 0 n 288 501 310 525 0 e 313 500 332 524 0 e 313 500 332 524 0 l 336 501 347 534 0 l 336 501 347 534 0 l 352 500 363 532 0 l 352 500 363 532 0 e 367 499 386 524 0 e 367 499 386 524 0 ” 389 520 407 532 0 ” 389 520 407 532 0 ` | ` As you can see, the low double quote character has been expressed as two single commas. The bounding boxes must be merged as follows ご覧のように、低い二重引用符は2つのシングルコンマとして表現されています。境界ボックスは次のようにマージする必要があります。 * First number (left) take the minimum of the two lines (197) *最初の数字(左)は2行のうち最小のものをとります(197) * Second number (bottom) take the minimum of the two lines (497) * 2番目の数字(下)は2行のうち最小の値を取ります(497) * Third number (right) take the maximum of the two lines (214) * 3番目の数字(右)は2行のうち最大のものをとる(214) * Fourth number (top) take the maximum of the two lines (510) * 4番目の数字(上)は最大2行(510)を取ります This gives これは与える ` | ` D 101 504 131 535 0 D 101 504 131 535 0 e 135 502 154 528 0 e 135 502 154 528 0 r 158 503 173 526 0 r 158 503 173 526 0 „ 197 497 214 510 0 197 497 214 510 0 s 220 501 236 526 0 s 220 501 501 236 526 0 c 239 501 258 525 0 c 239 501 258 525 0 h 262 502 284 534 0 h 262 502 284 534 0 n 288 501 310 525 0 n 288 501 310 525 0 e 313 500 332 524 0 e 313 500 332 524 0 l 336 501 347 534 0 l 336 501 347 534 0 l 352 500 363 532 0 l 352 500 363 532 0 e 367 499 386 524 0 e 367 499 386 524 0 ” 389 520 407 532 0 ” 389 520 407 532 0 ` | ` If you didn t successfully space out the characters on the training image, some may have been joined into a single box. In this case, you can either remake the images with better spacing and start again, or if the pair is common, put both characters at the start of the line, leaving the bounding box to represent them both. (As of 3.00, there is a limit of 24 bytes for the description of a "character". This will allow you between 6 and 24 unicodes to describe the character, depending on where your codes sit in the unicode set. If anyone hits this limit, please file an issue describing your situation.) トレーニング画像上の文字の間隔をうまく調整できなかった場合は、いくつかが1つのボックスに結合されている可能性があります。この場合は、間隔を空けてイメージを作り直してやり直すか、ペアが一般的な場合は、両方の文字を表すために境界ボックスを残して両方の文字を行頭に配置します。 (3.00以降、 "文字"の記述には24バイトの制限があります。これにより、コードがUnicodeセットのどこにあるかに応じて、6から24のUnicodeで文字を記述できます。制限してください、あなたの状況を説明する問題を提出してください。) Note that the coordinate system used in the box file has (0,0) at the bottom-left. Note ボックスファイルで使用されている座標系は左下に(0,0)を持っています。 The last number on each line is the page number (0-based) of that character in the multi-page tiff file. 各行の最後の番号は、マルチページTIFFファイル内のその文字のページ番号(0から始まる)です。 There are several visual tools for editing box file - please check AddOns wiki. ボックスファイルを編集するための視覚的なツールがいくつかあります - AddOns wikiを確認してください。 ### Bootstrapping a new character set ###新しい文字セットをブートストラップする If you are trying to train a new character set, it is a good idea to put in the effort on a single font to get one good box file, run the rest of the training process, and then use Tesseract in your new language to make the rest of the box files as follows もしあなたが新しい文字セットを訓練しようとしているのなら、一つのフォントに努力して一つの良いボックスファイルを作り、残りのトレーニングプロセスを実行し、そしてあなたの新しい言語でTesseractを使うのが良い考えです。その他のボックスファイルは次のとおりです。 ` | ` tesseract [lang].[fontname].exp[num].tif [lang].[fontname].exp[num] -l yournewlanguage batch.nochop makebox tesseract [言語]。[フォント名] .exp [数値] .tif [言語]。[フォント名] .exp [数値] -l yournewlanguage batch.nochop makebox ` | ` This should make the 2nd box file easier to make, as there is a good chance that Tesseract will recognize most of the text correctly. You can always iterate this sequence adding more fonts to he training set (i.e. to the command line of mftraining and cntraining below) as you make them, but note that there is no incremental training mode that allows you to add new training data to existing sets. This means that each time you run mftraining and cntraining you are making new data files from scratch from the tr files you give on the command line, and these programs cannot take an existing intproto / pffmtable / normproto and add to them directly. Tesseractがほとんどのテキストを正しく認識する可能性が高いので、これは2番目のボックスファイルを作りやすくします。あなたがそれらを作るとき、あなたはいつも彼のトレーニングセット(すなわち、下記の mftrainingとcntrainingのコマンドライン)にさらにフォントを追加することでこのシーケンスを繰り返すことができます、しかしあなたが新しいトレーニングを加えることを可能にする増分トレーニングモードがない既存のセットへのデータ。つまり、 mftrainingとcntrainingを実行するたびに、コマンドラインで指定したtrファイルから最初から新しいデータファイルを作成します。これらのプログラムは、既存の intproto /pffmtable / normprotoを使用できません。と直接追加します。 ### Tif/Box pairs provided! ### Tif / Boxペアが提供されました! Some Tif/Box file pairs are on the downloads page. (Note the tiff files are G4 compressed いくつかの Tif / Boxファイルのペアはダウンロードページにあります。 (tiffファイルはG4圧縮されています。 to save space, so you will have to have libtiff or uncompress them first). You could スペースを節約するためには、libtiffを用意するか、最初にそれらを解凍する必要があります。あなたは出来る follow the following process to make better training data for your own language or あなた自身の言語のためのより良いトレーニングデータを作るために次のプロセスに従ってください。 subset of an existing language, or add different characters/shapes to an existing language 既存の言語のサブセット、または既存の言語に異なる文字/図形を追加します。 1. Filter the box files, keeping lines for only the characters you want. 1.ボックスファイルをフィルタして、必要な文字だけを表示するようにします。 1. Run tesseract for training (below). 1.トレーニングのためにtesseractを実行します(下記)。 1. Cat the .tr files from multiple languages for each font to get the character set that you want and add the .tr files from your own fonts or characters. 1.フォントごとに複数の言語の.trファイルを集めて、必要な文字セットを取得し、独自のフォントまたは文字から.trファイルを追加します。 1. Cat the filtered box files in an identical way to the .tr files for handing off to unicharset_extractor. 1. unicharset \ _extractorに引き渡すために、.trファイルと同じ方法でフィルタ処理されたボックスファイルをキャットします。 1. Run the rest of the training process. 1.残りのトレーニングプロセスを実行します。 Caution! This is not quite as simple as it sounds! cntraining and mftraining can only あぶない!これはそれほど簡単ではありません。 cntrainingとmftrainingは take up to 64 .tr files, so you must cat all the files from multiple languages for the 最大64個の.trファイルを使用できます。 same font together to make 64 language-combined, but font-individual files. 同じフォントを組み合わせて64の言語を組み合わせたファイルを作成できますが、フォントは個別のファイルになります。 The characters found in the tr files must match the sequence trファイルにある文字は、シーケンスと一致している必要があります。 of characters found in the box files when given to unicharset_extractor, so you have to unicharset \ _extractorに渡されたときにボックスファイルで見つかった文字の数 cat the box files together in the same order as the tr files. trファイルと同じ順序でボックスファイルをまとめてください。 The command lines for cn/mftraining and unicharset_extractor must be given the .tr cn / mftrainingおよびunicharset \ _extractorのコマンドラインには、.trを指定する必要があります。 and .box files (respectively) in the same order just in case you have different 異なる場合に備えて、ファイルと.boxファイル(それぞれ)は同じ順序で filtering for the different fonts. 異なるフォントをフィルタリングします。 There may be a program available to do all this and pick out the characters in これらすべてを行い、文字を抽出するために利用可能なプログラムがあるかもしれません。 the style of character map. This might make the whole thing easier. 文字マップのスタイルこれは全体を簡単にするかもしれません。 ## Run Tesseract for Training ##トレーニングのためにTesseractを実行する For each of your training image, boxfile pairs, run Tesseract in training mode トレーニング画像、ボックスファイルのペアごとに、Tesseractをトレーニングモードで実行します。 ` | ` tesseract [lang].[fontname].exp[num].tif [lang].[fontname].exp[num] box.train tesseract [言語]。[フォント名] .exp [数値] .tif [言語]。[フォント名] .exp [数値] box.train ` | ` or または ` | ` tesseract [lang].[fontname].exp[num].tif [lang].[fontname].exp[num] box.train.stderr tesseract [言語]。[フォント名] .exp [数値] .tif [言語]。[フォント名] .exp [数値] box.train.stderr ` | ` NOTE that although tesseract requires language data to be present for this step, the language data is not used, so English will do, whatever language you are training. NOTE tesseractはこのステップのために言語データが存在することを要求しますが、言語データは使用されないので、あなたが訓練しているどんな言語でも、英語はそうするでしょう。 The first form sends all the errors to a file named tesseract.log. The second form sends all errors to stderr. 最初の形式はすべてのエラーをtesseract.logという名前のファイルに送ります。 2番目の形式はすべてのエラーをstderrに送ります。 Note that the box filename must match the tif filename, including the path, or Tesseract won t find it. The output of this step is fontfile.tr which contains the features of each character of the training page. [lang].[fontname].exp[num].txt will also be written with a single newline and no text. ボックスfilenameはパスを含むtifファイル名と一致しなければならないことに注意してください。そうしないとTesseractはそれを見つけられません。このステップの出力は fontfile.trです。これはトレーニングページの各文字の機能を含みます。 [lang]。[fontname] .exp [num] .txtも1行の改行でテキストは表示されません。 Important Check for errors in the output from apply_box. If there are FATALITIES reported, then there is no point continuing with the training process until you fix the box file. The new box.train.stderr config file makes is easier to choose the location of the output. A FATALITY usually indicates that this step failed to find any training samples of one of the characters listed in your box file. Either the coordinates are wrong, or there is something wrong with the image of the character concerned. If there is no workable sample of a character, it can t be recognized, and the generated inttemp file won t match the unicharset file later and Tesseract will abort. 重要 apply \ _boxからの出力にエラーがないか確認してください。死亡が報告されている場合は、ボックスファイルを修正するまでトレーニングプロセスを続行しても意味がありません。新しいbox.train.stderr設定ファイルにより、出力の場所を選択しやすくなりました。 FATALITYは通常、このステップであなたのボックスファイルにリストされているキャラクターの1つのトレーニングサンプルを見つけることができなかったことを示します。座標が間違っているか、関係するキャラクターのイメージに問題があります。実行可能な文字のサンプルがない場合、それは認識されず、生成されたinttempファイルは後でunicharsetファイルと一致せず、Tesseractは中止されます。 Another error that can occur that is also fatal and needs attention is an error about "Box file format error on line n". If preceded by "Bad utf-8 char..." then the UTF-8 codes are incorrect and need to be fixed. The error "utf-8 string too long..." indicates that you have exceeded the 24 byte limit on a character description. If you need a description longer than 24 bytes, please file an issue. 発生する可能性があるもう1つのエラーこれも致命的で注意が必要ですは "行nのボックスファイル形式エラー"に関するエラーです。 "Bad utf-8 char ..."が前に付いている場合、UTF-8コードは正しくないため修正する必要があります。エラー "utf-8 string too long ..."は、文字の説明で24バイトの制限を超えたことを示します。 24バイトを超える説明が必要な場合は、問題を報告してください。 There is no need to edit the content of the [lang].[fontname].exp[num].tr file. The font name inside it need not be set. [lang]。[fontname] .exp [num] .trファイルの内容を編集する必要はありません。その中のフォント名を設定する必要はありません。 For the curious, here is some information on the format. Every character in the box file has a corresponding set of entries in the .tr file (in order) like this 興味がある人のために、ここでフォーマットに関するいくつかの情報があります。ボックスファイル内のすべての文字には、.trファイル内に次のように対応する一連のエントリがあります。 ` | ` UnknownFont UTF-8 code(s) 2 UnknownFont UTF-8コード 2 mf mf 機能数 x y length dir 0 0 x yの長さdir 0 0 ... (there are a set of these determined by ...( 機能数 によって決定されるこれらのセットがあります) above) 上記) cn 1 CN 1 ypos length x2ndmoment y2ndmoment yposの長さx 2ndmoment y 2ndmoment ` | ` The mf features are polygon segments of the outline normalized to the mfフィーチャーは、に正規化されたアウトラインのポリゴンセグメントです。 1st and 2nd moments. 第一と第二の瞬間。 x= x position [-0.5,0.5] x = x位置[-0.5、0.5] y = y position [-0.25,0.75] y = y位置[-0.25,0.75] length is the length of the polygon segment [0,1.0] lengthはポリゴンセグメントの長さです[0,1.0] dir is the direction of the segment [0,1.0] dirはセグメントの方向です[0,1.0] The cn feature is to correct for the moment normalization to cn機能は瞬間の正規化をに修正することです distinguish position and size (eg c vs C and , vs ) 位置とサイズを区別する(例 cとC、そしてvs ) ## Compute the Character Set ##文字セットを計算する Tesseract needs to know the set of possible characters it can output. To generate the unicharset data file, use the unicharset_extractor program on the box files generated above Tesseractは出力可能な文字のセットを知っている必要があります。 unicharsetデータファイルを生成するには、上で生成したボックスファイルに対してunicharset_extractorプログラムを使います。 ` | ` unicharset_extractor [lang].[fontname].exp[num].box lang.fontname.exp1.box ... unicharset_extractor [lang]。[フォント名] .exp [num] .box lang.fontname.exp1.box ... ` | ` Tesseract needs to have access to character properties isalpha, isdigit, isupper, islower, ispunctuation. This data must be encoded in the unicharset data file. Each line of this file corresponds to one character. The character in UTF-8 is followed by a hexadecimal number representing a binary mask that encodes the properties. Each bit corresponds to a property. If the bit is set to 1, it means that the property is true. The bit ordering is (from least significant bit to most significant bit) isalpha, islower, isupper, isdigit. Tesseractは、文字プロパティisalpha、isdigit、isupper、islower、ispunctuationにアクセスできる必要があります。このデータは unicharsetデータファイルにエンコードされなければなりません。このファイルの各行は1文字に対応しています。 UTF-8の文字の後には、プロパティーをエンコードする2進マスクを表す16進数が続きます。各ビットはプロパティに対応します。ビットが1に設定されている場合は、そのプロパティがtrueであることを意味します。ビット順序は、(最下位ビットから最上位ビットへ)isalpha、islower、isupper、isdigitです。 Example 例 * ; is an punctuation character. Its properties are thus represented by the binary number 10000 (10 in hexadecimal). * ; 句読文字です。したがって、その特性は2進数10000(16進数で10)で表されます。 * b is an alphabetic character and a lower case character. Its properties are thus represented by the binary number 00011 (3 in hexadecimal). * b は英字と小文字です。したがって、その特性は2進数00011(3は16進数)で表されます。 * W is an alphabetic character and an upper case character. Its properties are thus represented by the binary number 00101 (5 in hexadecimal). * W は英字と大文字です。したがって、その特性は2進数00101(16進数で5)で表されます。 * 7 is just a digit. Its properties are thus represented by the binary number 01000 (8 in hexadecimal). * 7 は単なる数字です。その特性は、2進数01000(16進数で8)で表されます。 * = does is not punctuation not digit or alphabetic character. Its properties are thus represented by the binary number 00000 (0 in hexadecimal). * = は、数字や英字ではなく句読点ではありません。そのプロパティは、2進数00000(16進数で0)で表されます。 ` | ` ; 10 Common 46 ; 10コモン46 b 3 Latin 59 b 3ラテン語59 W 5 Latin 40 西5ラテン40 7 8 Common 66 7 8共通66 = 0 Common 93 = 0一般93 ` | ` Japanese or Chinese alphabetic character properties are represented by the binary number 00001 (1 in hexadecimal). 日本語または中国語の英字プロパティーは、2進数00001(1は16進数)で表されます。 If your system supports the wctype functions, these values will be set automatically by unicharset_extractor and there is no need to edit the unicharset file. On some very old systems (eg Windows 95), the unicharset file must be edited by hand to add these property description codes. あなたのシステムがwctype関数をサポートしている場合、これらの値は unicharset_extractorによって自動的に設定されます。 unicharset ファイルを編集する必要はありません。非常に古いシステム(例えばWindows 95)では、 unicharsetファイルはこれらの特性記述コードを追加するために手で編集されなければなりません。 Last two columns represent type of script (Latin, Common, Greek, Cyrillic, Han, NULL) and id code of character given language. 最後の2つの列は、スクリプトのタイプ(ラテン語、共通文字、ギリシャ語、キリル文字、ハン語、NULL)、および指定された言語の文字のIDコードを表します。 NOTE The unicharset file must be regenerated whenever inttemp, normproto and pffmtable are generated (i.e. they must all be recreated when the box file is changed) as they have to be in sync. 注意 inttemp、normproto、 pffmtableが生成されたときはいつでもunicharsetファイルは再生成されなければなりません(つまり、ボックスファイルが変更されたときはすべて再作成されなければなりません)。同期する ## font_properties (new in 3.01) ## font \ _properties(3.01の新機能) A new requirement for training in 3.01 is a font_properties file. The purpose of this file is to provide font style information that will appear in the output when the font is recognized. The font_properties file is a text file specified by the -F filename option to mftraining. 3.01でトレーニングをするための新しい要件は font_propertiesファイルです。このファイルの目的は、フォントが認識されたときに出力に表示されるフォントスタイル情報を提供することです。 font_propertiesファイルはmftrainingの -F filenameオプションで指定されたテキストファイルです。 Each line of the font_properties file is formatted as follows font_propertiesファイルの各行は以下のようにフォーマットされています。 ` | ` フォント名 イタリック ボールド 固定 サービス フラクタ ` | ` where fontname is a string naming the font (no spaces allowed!), and italic , bold , fixed , serif and fraktur are all simple 0 or 1 flags indicating whether the font has the named property. ここで フォント名 はフォントの名前を表す文字列(スペースは使えません!)、そして italic 、 bold 、 fixed 、 serif および fraktur はフォントが名前付きプロパティを持っているかどうかを示すすべての単純な0または1のフラグ。 When running mftraining, each .tr filename must match an entry in the font_properties file, or mftraining will abort. At some point, possibly before the release of 3.01, this matching requirement is likely to shift to the font name in the .tr file itself. The name of the .tr file may be either fontname.tr or [lang].[fontname].exp[num].tr. mftrainingを実行するとき、それぞれの.trファイル名はfont_propertiesファイルの中のエントリーと一致しなければなりません、さもなければ mftrainingは中止するでしょう。おそらく3.01のリリース前のある時点で、この一致要件は.trファイル自体のフォント名にシフトする可能性があります。 .trファイルの名前は fontname.trか[lang]。[fontname] .exp [num] .trのいずれかです。 Example 例 font_properties file font_propertiesファイル ` | ` timesitalic 1 0 0 1 0 timesitalic 1 0 0 1 0 ` | ` ` | ` shapeclustering -F font_properties -U unicharset eng.timesitalic.exp0.tr shapeclustering -F font_properties -U unicharset eng.timesitalic.exp0.tr mftraining -F font_properties -U unicharset -O eng.unicharset eng.timesitalic.exp0.tr mftraining -F font_properties -U unicharset -O eng.unicharset eng.timesitalic.exp0.tr ` | ` Note that in 3.03, there is a default font_properties file, that covers 3000 fonts (not necessarily accurately) located in this repo https //github.com/tesseract-ocr/langdata. Note 3.03には、このリポジトリにある3000フォント(必ずしも正確ではない)をカバーするデフォルトの font_propertiesファイルがあります [https //github.com/tesseract-ocr/langdata](https //raw.githubusercontent.com/tesseract-ocr/langdata/master/font_properties)。 ## Clustering ##クラスタリング When the character features of all the training pages have been extracted, we need to cluster them to create the prototypes. すべてのトレーニングページの特徴を抽出したら、それらをクラスタ化してプロトタイプを作成する必要があります。 The character shape features can be clustered using the shapeclustering, mftraining and cntraining programs 文字の形の特徴は shapeclustering、mftraining、 cntrainingプログラムを使ってクラスタ化することができます。 ### shapeclustering (new in 3.02) ### shapeclustering(3.02の新機能) shapeclustering should not be used except for the Indic languages. shapeclustering はインド系言語以外では使うべきではありません。 ` | ` shapeclustering -F font_properties -U unicharset [lang].[fontname].exp[num].tr lang.fontname.exp1.tr ... shapeclustering -F font_properties -U unicharset [lang]。[フォント名] .exp [num] .tr lang.fontname.exp1.tr ... ` | ` shapeclustering creates a master shape table by shape clustering and writes it to a file named shapetable. shapeclusteringはシェイプクラスタリングによってマスターシェイプテーブルを作成し、それをshapetableという名前のファイルに書き込みます。 ### mftraining ### mftraining ` | ` mftraining -F font_properties -U unicharset -O [lang].unicharset [lang].[fontname].exp[num].tr lang.fontname.exp1.tr ... mftraining -F font_properties -U unicharset -O [lang] .unicharset [lang]。[フォント名] .exp [num] .tr lang.fontname.exp1.tr ... ` | ` The -U file is the unicharset generated by unicharset_extractor above, and lang.unicharset is the output unicharset that will be given to combine_tessdata. -Uファイルは上記の unicharset_extractorによって生成されたユニキャストで、lang.unicharsetはcombine_tessdataに渡される出力ユニキャストです。 mftraining will output two other data files inttemp (the shape prototypes) and pffmtable (the number of expected features for each character). In versions 3.00/3.01, a third file called Microfeat is also written by this program, but it is not used. Later versions don t produce this file. mftrainingは他の2つのデータファイルを出力します inttemp(形状プロトタイプ)と pffmtable(各文字に期待される機能の数)。バージョン3.00 / 3.01では、 Microfeatと呼ばれる3番目のファイルもこのプログラムによって書かれていますが、使用されていません。最近のバージョンではこのファイルは生成されません。 NOTE mftraining will produce a shapetable file if you didn t run shapeclustering. You must include this shapetable in your traineddata file, whether or not shapeclustering was used. NOTE shapeclusteringを実行していなければ、mftrainingは shapetableファイルを作成します。 shapeclusteringが使われていようとなかろうと、あなたはトレーニングされたデータファイルにこのshapetableを含める必要があります。 ### cntraining ### cntraining ` | ` cntraining [lang].[fontname].exp[num].tr lang.fontname.exp1.tr ... cntraining [lang]。[fontname] .exp [num] .tr lang.fontname.exp1.tr ... ` | ` This will output the normproto data file (the character normalization sensitivity prototypes). これは normprotoデータファイル(文字正規化感度プロトタイプ)を出力します。 ## Dictionary Data (Optional) ##辞書データ(オプション) Tesseract uses up to 8 dictionary files for each language. These are all optional, and help Tesseract to decide the likelihood of different possible character combinations. Tesseractは各言語につき最大8つの辞書ファイルを使用します。これらはすべてオプションであり、Tesseractがさまざまな文字の組み合わせの可能性を判断するのに役立ちます。 Seven of the files are coded as a Directed Acyclic Word Graph (DAWG), and the other is a plain UTF-8 text file ファイルのうち7つは有向非循環ワードグラフ(DAWG)としてコード化されており、もう1つはプレーンなUTF-8テキストファイルです。 Name Type Description 名前 タイプ 説明 --------- --------- ---------------- --------- --------- ---------------- word-dawg dawg A dawg made from dictionary words from the language. 夜明け夜明けその言語からの辞書の単語から作られた夜明け。 freq-dawg dawg A dawg made from the most frequent words which would have gone into word-dawg. freq-dawg 夜明けword-dawgになっていたであろう最も頻繁な単語から作られた夜明け。 punc-dawg dawg A dawg made from punctuation patterns found around words. The "word" part is replaced by a single space. punc-dawg夜明け句読点パターンから作られた一言が言葉の周りに見つかった。 _ "word" _部分は単一のスペースに置き換えられます。 number-dawg dawg A dawg made from tokens which originally contained digits. Each digit is replaced by a space character. 夜明け夜明けもともと数字を含んでいたトークンから作られた夜明け。各桁はスペース文字に置き換えられます。 fixed-length-dawgs dawg Several dawgs of different fixed lengths —— useful for languages like Chinese. [Not used since version 3.03] 固定長dawgs 夜明け固定長の異なるいくつかのドッグ - 中国語などの言語に役立ちます。 [バージョン3.03から使用されていません] bigram-dawg dawg A dawg of word bigrams where the words are separated by a space and each digit is replaced by a ?. bigram-dawg 夜明け単語がスペースで区切られ、各数字が_?_で置き換えられている単語バイグラムの合成。 unambig-dawg dawg TODO Describe. unambig-dawg夜明けTODO 説明してください。 user-words text A list of extra words to add to the dictionary. Usually left empty to be added by users if they require it; see tesseract(1). ユーザーの言葉テキスト 辞書に追加する追加の単語のリスト。ユーザーが必要に応じて追加するために、通常は空のままにします。 tesseract(1)を参照してください。 To make the DAWG dictionary files, you first need a wordlist for your language. You may find an appropriate dictionary file to use as the basis for a wordlist from the spellcheckers (e. g. ispell, aspell or hunspell) - be careful about the license. The wordlist is formatted as a UTF-8 text file with one word per line. Split the wordlist into needed sets e.g. the frequent words, and the rest of the words, and then use wordlist2dawg to make the DAWG files DAWG辞書ファイルを作成するには、まずあなたの言語のワードリストが必要です。スペルチェッカからの単語リストの基礎として使用するのに適切な辞書ファイルを見つけることができます(例 ispell、[aspell] (http //aspell.net/)または[hunspell](http //hunspell.sourceforge.net/)) - ライセンスについて注意してください。ワードリストは、1行に1ワードのUTF-8テキストファイルとしてフォーマットされています。単語リストを必要なセット、例えば頻繁な単語と残りの単語に分割してから wordlist2dawgを使ってDAWGファイルを作成します。 ` | ` wordlist2dawg frequent_words_list [lang].freq-dawg [lang].unicharset wordlist2dawg frequent_words_list [lang] .freq-dawg [lang] .unicharset wordlist2dawg words_list [lang].word-dawg [lang].unicharset wordlist2dawg words_list [lang] .word-dawg [lang] .unicharset ` | ` For languages written from right to left (RTL), like Arabic and Hebrew, add -r 1 to the wordlist2dawg command. アラビア語やヘブライ語のように右から左(RTL)で書かれた言語の場合、 wordlist2dawgコマンドに-r 1を追加してください。 Other options can be found in wordlist2dawg Manual Page 他のオプションはwordlist2dawgマニュアルページにあります。 NOTE If a dictionary file is included in the combined traineddata, it must contain at least one entry. Dictionary files that would otherwise be empty are not required for the combine_tessdata step. 注 辞書ファイルが結合トレーニングデータに含まれている場合は、少なくとも1つのエントリが含まれていなければなりません。そうでなければ空になる辞書ファイルは combine_tessdataステップには必要ありません。 Words with unusual spellings should be added to the dictionary files. Unusual spellings can include mixtures of alphabetical characters with punctuation or numeric characters. (E.g. i18n, l10n, google.com, news.bbc.co.uk, io9.com, utf8, ucs2) 珍しい綴りの単語は辞書ファイルに追加されるべきです。異常なスペルには、英字と句読点または数字の混在が含まれる場合があります。 (例 国際化、国際化、国際化、google.com、news.bbc.co.uk、io9.com、utf8、ucs2) If you need example files for dictionary wordlists, uncombine (with combine_tessdata) existing language data file (e.g. eng.traineddata) and then extract wordlist with dawg2wordlist 辞書の単語リストのサンプルファイルが必要な場合は、既存の言語データファイル(combine \ _tessdataを使用)を結合解除します(例 eng.traineddata)その後、dawg2wordlistで単語リストを抽出します ## The last file (unicharambigs) ##最後のファイル(unicharambigs) The final data file that Tesseract uses is called unicharambigs. It describes possible ambiguities between characters or sets of characters, and is manually generated. To understand the file format, look at the following example Tesseractが使う最後のデータファイルは unicharambigsです。これは、文字間または文字セット間のあいまいさを表し、手動で生成されます。ファイル形式を理解するために、次の例を見てください。 ` | ` v1 v1 2 1 " 1 2 1 "1 1 m 2 r n 0 1 m 2 r n 0 3 i i i 1 m 0 3 i i i 1 m 0 ` | ` The first line is a version identifier. The remaining lines are tab separated fields, in the following format 1行目はバージョンIDです。残りの行はタブ区切りのフィールドで、次の形式です。 ` | ` 一致元の文字数 タブ 一致元の文字数 タブ 一致先の文字数 タブ 一致先の文字数 タブ タイプ区分 ` | ` Type indicator could have following values 次の値を示すタイプインジケータ[https //github.com/tesseract-ocr/tesseract/blob/master/ccutil/ambigs.h#L44]。 Value Type Description 値 タイプ 説明 ---------- --------- ---------------- ---------- --------- ---------------- 0 A non-mandatory substitution. This informs tesseract to consider the ambiguity as a hint to the segmentation search that it should continue working if replacement of source with target creates a dictionary word from a non-dictionary word. Dictionary words that can be turned to another dictionary word via the ambiguity will not be used to train the adaptive classifier. 0 必須ではない代用これは、 source を target に置き換えることで辞書以外の単語から辞書の単語が作成された場合でも、あいまいさが引き続き機能するというヒントとして、あいまいさを考慮することをテセクタに知らせます。あいまいさを介して別の辞書の単語に変えることができる辞書の単語は、適応分類器を訓練するためには使用されません。 1 A mandatory substitution. This informs tesseract to always replace the matched source with the target strings. 1 必須の代用品です。これは、一致した「ソース」を「ターゲット」の文字列に常に置き換えるようにテセラクトに通知します。 Example line Explanation 行の例 説明 ----------------- ---------------- ----------------- ---------------- 2 1 " 1 A double quote (") should be substituted whenever 2 consecutive single quotes ( ) are seen. 2 1 "1 二重引用符(")は、連続した二重引用符( )が2つ見られる場合は必ず**に置き換えてください。 1 m 2 r n 0 The characters rn may sometimes be recognized incorrectly as m . 1 m 2 r n 0 0文字 rn は m として誤って認識されることがあります。 3 i i i 1 m 0 The character m may sometimes be recognized incorrectly as the sequence iii . 3 i i i 1 m 0 0文字 m は、シーケンス iii として誤って認識されることがあります。 Each separate character must be included in the unicharset. That is, all of the characters used must be part of the language that is being trained. それぞれの別々の文字は、ユニキャストに含まれていなければなりません。つまり、使用されるすべての文字は、訓練されている言語の一部でなければなりません。 The rules are not bidirectional, so if you want rn to be considered when m is detected and vise versa you need a rule for each. 規則は双方向ではないので、「m」が検出されたときに「rn」が考慮されるようにしたい場合、またその逆の場合はそれぞれに規則が必要です。 Like most other files used in training, the unicharambigs file must be encoded as UTF-8, and must end with a newline character. 他のほとんどのトレーニング用ファイルと同様に、 unicharambigsファイルはUTF-8としてエンコードされ、改行文字で終わらなければなりません。 The unicharambigs format is also described in the unicharambigs(5) man page. unicharambigsフォーマットはunicharambigs(5)manページにも記述されています。 The unicharambigs file may also be non-existent. unicharambigsファイルも存在しないかもしれません。 # Putting it all together # すべてを一緒に入れて That is all there is to it! All you need to do now is collect together all the files (shapetable, normproto, inttemp, pffmtable) and rename them with a lang. prefix, where lang is the 3-letter code for your language taken from http //en.wikipedia.org/wiki/List_of_ISO_639-2_codes and then run combine_tessdata on them as follows それだけです。今する必要があるのは、すべてのファイル( shapetable、normproto、 inttemp、pffmtable)を集めて、それらを lang.接頭辞で名前を変更することです。langはあなたのための3文字のコードです。 http //en.wikipedia.org/wiki/List_of_ISO_639-2_codesから取得した言語を選択してから、次のようにそれらに combine_tessdataを実行します。 ` | ` combine_tessdata [lang]. combine_tessdata [lang]。 ` | ` NOTE Don t forget dot at the end! 注 最後にドットを忘れないでください! The resulting lang.traineddata goes in your tessdata directory. Tesseract can then recognize text in your language (in theory) with the following 結果のlang.traineddataはあなたのtessdataディレクトリに入ります。 Tesseractはそれからあなたの言語のテキストを(理論的に)次のように認識することができます ` | ` tesseract image.tif output -l [lang] tesseract image.tifの出力-l [lang] ` | ` (Actually, you can use any string you like for the language code, but if you want anybody else to be able to use it easily, ISO 639 is the way to go.) (実際には、言語コードに好きな文字列を使用できますが、他の人が簡単に使用できるようにしたい場合は、ISO 639が適しています。) More options of combine_tessdata can be found on its Manual Page or in comment of its source code. combine_tessdataのその他のオプションはマニュアルページまたは[ソースコード]のコメントにあります。 ](https //github.com/tesseract-ocr/tesseract/blob/master/training/combine_tessdata.cpp#L23)。 You can inspect some of the internals of traineddata files in 3rd party online Traineddata inspector. あなたはサードパーティのオンライン訓練データ検査官で訓練データファイルの内部のいくつかを調べることができます。
https://w.atwiki.jp/cadencii_en/pages/29.html
English 日本語 Release Note Release Date 1 Jan., 2010 Notes Cadencii requires ".NET Framework Runtime(version 2.0 or later)". Installer of this rumtime is available from the link below. .NET Framework Runtime Download .NET Framework 3.5 SP1 Cadencii can be launched with the latest version of mono. This enable you to use Cadencii with many platforms supported by mono. (Note Several functions using VOCALOID2 VSTi are not available in this case.) Mono is available from the link mono download Download Cadencii version 3.0.8 (1170KB) How to get source codes Source code is available on SourceForege.JP. Please follow the instruction below for checking out the SourceForge.JP s SVN repository. svn checkout -r 759 http //svn.sourceforge.jp/svnroot/cadencii/branches/3.0 ./ These svn command is for checiking out "THIS" version of Cadencii. In order to get the latest source codes, please remove "-r" option.
https://w.atwiki.jp/fukubukuro/pages/1002.html
【評価】福 【ブランド】any sis 【金額】10500 【購入場所】田舎モール 【中身】 ○ ダウンショートコートベージュ 中綿ではないしラインもよし。ショート着ないけどまぁ。 ○ ピンクローゲージタートルニット タートルあんまりきないけど色味とデザインがよし ◎ チェック大判ストール この手の買おうとしてた!!!! ○ ボーダーカットソー 無難 【まとめwikiへの転載】可 全部使えるのでよかった。 何年か前に痛い目見たけど、買ってよかった
https://w.atwiki.jp/deadspace_3/pages/73.html
Optional Mission "Conning Tower" 司令塔到着 詰め所内通信記録 Tram Radio 2 エレベーター内アナウンス 広間にて ハッキング成功 無線室 電撃の壁 重力発生装置異常 エレベーター前 環境コントロール室 ジェネレーター停止 最上階 Edwards 06 物資入手 脱出 司令塔到着 Announce Now arriving... Conning Tower. 停車致しました…司令塔です。 詰め所内通信記録 Tram Radio 2 Val I m... I m sorry Tucker. But you heard Mahad s announcement. We re facing a Scenario Five situation. ご、ごめんなさい、Tucker。でもあなたはMahadの発表を聞いたから…私達はシナリオ5の状況に直面している。 Edwards Scenario Five? What the hell does that even mean? シナリオ5?どういう意味なんだそれは? Val It means you have to die. We all do. If we don t, he ll just send someone over to do it for us. あなたが死ぬってことよ。みんな死ななきゃいけないの。そうしないと(Mahadは)私達を殺すために他の誰かを送り込んでくるわ。 Edwards Come on, Valery. Just put that down. They don t have to know... なぁValery。そんなもの下ろしてくれ。あいつらは知らなくていい… Val I m sorry! I m... so sorry... I... ごめんなさい!本当に…本当に…ごめんなさ… Edwards Not as sorry as I am, Commander. And if any one of them jacked up jarheads tries to come for me, they ll be sorry too. 俺の方が後悔してるよ、中佐。これで脳なしの筋肉バカどもが俺のとこにやってきたら、奴らにも後悔させてやる。 エレベーター内アナウンス Edwards I see you! Guess you were smart enough to make it past my lockout. So you must not be one of those no-neck dipshits on the General s goon squad. But before you go patting yourself on the back, you should know that was the easy part. Your day is about to get a whole lot worse. やぁ、こんにちは!俺のロックを簡単に解いた賢い君。ということは君が将軍が送り込んだチンピラの脳無し招待客じゃないってことだ。でもそれはまだほんの序の口だ。君がやってることは状況を更に悪くしてる。 広間にて Edwards All the infected soldiers - they brought them up here for "safe keeping". You may think you can put a bullet in my dome, but I ve got a ready-made army that says you can t. 全ての感染した兵士―――奴らは彼らを”保管”するために地上からここまで持ち込んだんだ。君は俺の脳天に鉛玉を撃ちこめると思ってるだろうが、でも俺の兵隊たちがそんなことはさせないぜ。 Edwards Gotcha! Now it s time for a little fun. Computer - arm explosives. やった!さぁ、ちょっとお楽しみの時間だ。コンピューター、爆弾を起動しろ。 Edwards And... detonate. それじゃあ…ぶっ飛びな。 Announce Warning Contamination detected. Quarantine lockdown activated. 警告:汚染を検出しました。隔壁を起動しました。 Buckell I m reading a quarantine lockdown. Are you alright? 隔壁が下りたって聞こえたんだが。大丈夫か? Isaac No! Not really! I m locked in! くそっ! 大丈夫じゃない! 閉じ込められた! Buckell There must be an override on one of the walls. 壁のどこかに解除装置があるはずだ。 Isaac Okay! I ll look for it as soon as I m not being stabbed in the face! わかった! できるだけ早く探す! ハッキング成功 Announce Override accepted. Quarantine lifted. Please report this event to your superior officer. 無効化が受理されました。隔壁は上がりました。貴方の上官に今回発生した事象を報告して下さい。 無線室 Edwards Guess you got a knack for killing anything that moves. Fine. But that arsenal of yours ain t gonna help you now. You can t shoot what you can t see(実際のセリフ:You can t kill electricity!) 動くモノは何でも殺すのがお得意って訳だ。いいだろう。でも、今度はその武器は君を助けてくれないだろう。何故って君は見えないモノは撃てないからね!(電気は殺せないからね!) 電撃の壁 Isaac Buckell, Edwards has rigged some kind of electrical trap. Looks like a homemade job with a short-range transmitter. Buckell、Edwardsが電気トラップようなものを仕掛けた。お手製の短距離トランスミッターみたいだな。 Buckell Short-range, huh? Well the control box must be nearby. If you can find it... 短距離、か。じゃあ近くにコントロールボックスがあるはずだ。見つけたら… Isaac I can shoot it. Thanks! 撃てばいいって訳か。助かる! Buckell That-a-boy. 正解だ。 Isaac Got it! やったぞ! 重力発生装置異常 Edwards Surprise! Surprise! Bet you didn t know you could reverse gravity plating and hammer someone into the ceiling? I gotta admit, I didn t either until I tried. Go on. Step into the gravity flow. I dare ya! びっくりしたろ!君が重力発生装置を逆にすれば天井に叩きつけられるということを知らなかった方に賭けようか?認めよう、俺は試してみるまで知らなかった。来いよ。重力流に入ってみろよ。やれるもんならな! Isaac Edwards rigged up some kind of gravity well. Edwardsの奴、今度は重力をいじりやがった。 Buckell Yeah I see it. There was a spike in power usage from Environmental Control when it triggered. ああ、見えてる。それが起きた時、環境コントロール室の電力使用量にスパイクがあった。 Isaac That must be where he s drawing power. 電気を流してるのはそこのはずだ。 Buckell Environmental isn t far from where you are. Here, I ll send you the coordinates. 環境コントロールはそこから余り遠くない。今からそっちに座標を送る。 エレベーター前 Edwards Look, you know I m not screwing around. And I can t just let you waltz into Environmental. I don t wanna die. I m sorry. Computer - arm explosives. And... detonate. Be seeing ya. なあ、俺は時間を無駄にしてるわけじゃない、知ってるだろ。黙って環境コントロールまで通してやるってわけにはいかない。俺は死にたくないんだ。悪いな。コンピューター、爆薬をセット、...起爆しろ。それじゃまたな。 Announce Warning Contamination detected. Quarantine lock down activated. 警告:汚染を検出しました。隔壁を起動して下さい。 Announce Override accepted. Quarantine lifted. Please report this event to your superior officer. 無効化が受理されました。隔壁は上がりました。貴方の上官に今回発生した事象を報告して下さい。 環境コントロール室 Isaac He hot-wired the power from Environmental alright. Any workarounds from your end? 確かに奴は環境室から力場に干渉してたみたいだ。そっちから何か解除方法は分からないか? Buckell Nope. The only way that trap s coming down is by pulling apart the power generator somehow. いや。どうにかしてジェネレーターを引き離すしかないな。 Isaac It s spinning too fast, I can t see what s going on. 高速で回ってて見えないぞ。 Buckell Can you slow it down? お前には遅くすることが出来るだろう? Isaac I ll give it a shot. やってみる。 ジェネレーター停止 Edwards I never wanted to hurt anybody. You know? I just wanted to live. That s all I wanted; To live... I wanted to live. 誰も傷つけたくなかった。分かるか?俺は死にたくないだけだ。求めてるのはそれだけだ。俺は生きたかった。 Buckel That did the trick. Gravity is reading normal again. 用は済んだ。重力も元に戻ってるはずだ。 Isaac What do you think is worse, Buckell? Dying along with everyone else or being the only one who survives? Buckell、あんたはどっちが辛いと思う?みんなと死ぬか、それとも一人だけ生き残ってしまうか? Buckell It s not the dying that scares me. It s not making a difference before I do. You... uh, you should be able to make it to the top of the Conning Tower now, Isaac. If Edwards is around, that s where you ll find him. And his stash. 俺が怖いのは死ぬことじゃない。どっちも大した違いはないさ。お前なら…司令塔の最上階まで辿り付けるだろう。Edwardsがいるとしたら恐らくそこだ。奴が隠してるものと一緒にな。 Isaac Right. ああ。 最上階 Edwards 06 Edwards Congratulations. You found me. Kind of stupid, ain t it? I just wanted to live and now that I m the only one left, I couldn t give a shit. With all this time alone, I realize it s just like Sam said. I m a lazy prick who never took one for the team. Well, team, if you can hear me now, this one s for you. おめでとう。君は俺を見つけることが出来た。馬鹿みたいだろ?俺はただ生きたかっただけだ、だが独り取り残されてみたら何もかもどうでもよくなっちまった。一人になったことで、Samの言っていたことが理解できた。俺は仲間のことを考えないぐうたらのろくでなしだと。あぁ、お仲間さんよ、俺の声が聞こえてるなら、あんたにこれをやるよ。 物資入手 Edwards It took me a while, but I realize now why we couldn t be allowed to live. So, if you ve found this, and you re still alive, I guess I can finally do my part. Computer blow all remaining charges. It s time for you to join us. 気づくのに大分時間がかかったが、何で俺が生きてちゃいけなかったのか理解出来たよ。君がまだ生きてて、このログを見つけたなら、やっと俺は自分の役割を果たせそうだ。コンピューター、残りの爆薬を全て吹き飛ばせ。さあ、俺達の元に来いよ。 脱出 Buckell Well was it worth a look? どうだ、一見の価値有りだったか? Isaac Yeah, tucker had a nice pile of salvage. あぁ、資材をたっぷり溜め込んでた。 Buckell Good. よし。 Isaac I m headed to the aft section now to check out that shuttle. Hopefully it s not a piece of shit. 俺はこれからシャトルをチェックするために後方部に向かう。運が良ければクソってほどでもないかもな。